We introduce a family of interpretable machine learning models, with two broad additions: Linearised Additive Models (LAMs) which replace the ubiquitous logistic link function in General Additive Models (GAMs); and SubscaleHedge, an expert advice algorithm for combining base models trained on subsets of features called subscales. LAMs can augment any additive binary classification model equipped with a sigmoid link function. Moreover, they afford direct global and local attributions of additive components to the model output in probability space. We argue that LAMs and SubscaleHedge improve the interpretability of their base algorithms. Using rigorous null-hypothesis significance testing on a broad suite of financial modelling data, we show that our algorithms do not suffer from large performance penalties in terms of ROC-AUC and calibration.
translated by 谷歌翻译
通知飞行员(NOTAM)包含重要的飞行路线相关信息。为了搜索和过滤它们,将NOTAMS分组为称为QCodes的类别。在本文中,我们开发了一种工具来预测notam的qcode。我们提出了一种使用DASH,Gunluk和Wei(2018)中提出的列生成扩展可解释的二进制分类的方法。我们描述了用于解决与一个VS-REST分类有关的问题,例如多个输出和类失衡。此外,我们介绍了一些启发式方法,包括使用CP-SAT求解器用于子问题,以减少训练时间。最后,我们表明我们的方法与最先进的机器学习算法(如线性SVM和小型神经网络)相比,同时添加了所需的可解释性组件。
translated by 谷歌翻译
增强学习(RL)的潜力是通过奖励工程问题的部分瓶颈部分瓶颈。启发式试验和错误的一个替代方案是基于偏好的RL(PBRL),其中奖励函数从稀疏的人体反馈推断出来。然而,先前的PBR方法缺乏学习奖励结构的可解释性,这妨碍了评估鲁棒性和对准的能力。我们提出了一种在线,积极的偏好学习算法,用树木的本质上可解释,构成结构构建奖励功能。使用合成和人为提供的反馈,我们在若干环境中展示了树结构奖励功能的样本高效学习,然后利用增强的解释性来探索和调试进行对齐。
translated by 谷歌翻译
System identification, also known as learning forward models, transfer functions, system dynamics, etc., has a long tradition both in science and engineering in different fields. Particularly, it is a recurring theme in Reinforcement Learning research, where forward models approximate the state transition function of a Markov Decision Process by learning a mapping function from current state and action to the next state. This problem is commonly defined as a Supervised Learning problem in a direct way. This common approach faces several difficulties due to the inherent complexities of the dynamics to learn, for example, delayed effects, high non-linearity, non-stationarity, partial observability and, more important, error accumulation when using bootstrapped predictions (predictions based on past predictions), over large time horizons. Here we explore the use of Reinforcement Learning in this problem. We elaborate on why and how this problem fits naturally and sound as a Reinforcement Learning problem, and present some experimental results that demonstrate RL is a promising technique to solve these kind of problems.
translated by 谷歌翻译
了解极端事件及其可能性是研究气候变化影响,风险评估,适应和保护生物的关键。在这项工作中,我们开发了一种方法来构建极端热浪的预测模型。这些模型基于卷积神经网络,对极长的8,000年气候模型输出进行了培训。由于极端事件之间的关系本质上是概率的,因此我们强调概率预测和验证。我们证明,深度神经网络适用于法国持续持续14天的热浪,快速动态驱动器提前15天(500 hpa地球电位高度场),并且在慢速较长的交货时间内,慢速物理时间驱动器(土壤水分)。该方法很容易实现和通用。我们发现,深神经网络选择了与北半球波数字3模式相关的极端热浪。我们发现,当将2米温度场添加到500 HPA地球电位高度和土壤水分场中时,2米温度场不包含任何新的有用统计信息。主要的科学信息是,训练深层神经网络预测极端热浪的发生是在严重缺乏数据的情况下发生的。我们建议大多数其他应用在大规模的大气和气候现象中都是如此。我们讨论了处理缺乏数据制度的观点,例如罕见的事件模拟,以及转移学习如何在后一种任务中发挥作用。
translated by 谷歌翻译
由于极端热波和热圆顶对社会和生物多样性的影响,他们的研究是一个关键挑战。我们专门研究了持久的极端热浪,这是气候影响最重要的热潮。物理驱动天气预报系统或气候模型可用于预测其发生或预测其概率。目前的工作探讨了使用深度学习架构的使用,使用气候模型的输出训练,作为预测极端持久热浪的发生的替代策略。这种新方法将对包括气候模型统计数据研究的几个关键科学目标,建立了对气候模型中罕见事件的定量代理,研究了气候变化的影响,并最终应对预测有用。履行这些重要目标意味着解决与罕见事件预测有本质相关的类大小不平衡的问题,评估转移学习的潜在好处,以解决极端事件的嵌套性质(自然包含在不太极端的情况下)。我们训练一个卷积神经网络,使用1000年的气候模型产出,具有大级欠采样和转移学习。从观察到的表面温度和500 HPA地球态高度场的快照,训练有素的网络在预测持久的极端热浪的发生时实现了显着性能。我们能够以三种不同的强度预测它们,早在活动开始前15天(事件结束前30天)。
translated by 谷歌翻译